技術問答
技術文章
iT 徵才
Tag
聊天室
2025 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
3
0
AI & Data
YOLO系列網路技術採用以及實作
系列 第
3
篇
[DAY 3] YOLOv2
15th鐵人賽
Xian
2023-09-18 16:00:22
650 瀏覽
分享至
YOLO9000: Better, Faster, Stronger
Joseph Redmon, Ali Farhadi
可偵測超過9000種類別
問題
過去方法只能辨識很少的類別物件。
替影像作detection標註比做classification標註更耗時。
跟Region proposal based的方法相比,YOLOv1 recall較低。
要提升準確度往往需要提高網路複雜度。
方法:
Better
Batch Normalization
: 取代Dropout,加快收斂且
提升2% mAP
。
High Resolution Classifier
: 先用448×448像素值的影像預先進行訓練10個epochs,先
提升4% mAP
。
Anchor Boxes
:
移除全連結層,並用Anchor Boxes預測Bounding Boxes。
輸入為416×416為了讓特徵圖中的座標為奇數個,這樣中心點座標就會唯一。mAP會下降,但是提升了Recall。
Dimension Clusters
:過去需手動設定Anchor Box數量以及尺寸,但本文利用K-means去生成Bounding Box,可以使得模型學得更好。
K-mean用:
最終求得:
K=5
,Recall跟模型複雜度較為適合。
Direct location prediction
: 每個Grid Cell預測五個Bounding Box,
並且有五個值
bx,by:預測的Bounding Box中心點位置+距離最左邊跟最上面Grid Cell的格數。
bw,bh:預測的Bounding Box寬跟高乘上寬跟高篇移量的exponential結果。
信心度值會再經過sigmoid後輸出
Fine-Grained Features
:串接較為淺層的特徵到深層網路當中,提升1%。
Multi-Scale Training
:為了讓模型可以處理不同大小的影像,每10個batch會重新選擇一個新的影像大小{320,352, ...,608}
Faster
物件偵測網路常採用VGG-16用於特徵提取,但是因為VGG-16參數量太大,YOLOv2提出一個新的分類模型: Darknet-19。
Darknet-19
: 19個convolution layers,5個max pooling layers,參數量少很多。
Stronger
當將兩個Dataset進行合併的時候可能會遇到類別互斥問題,舉論文例子:對於一張狗的影像,有的資料集標得是"狗",有的資料集標的是狗的品種。
建立
Hierarchical Wordtree
:
可藉由路徑上的節點機率來得到對應類別的機率,其中phisical object代表影像中是否有物件存在。
模型訓練
Classification:會先用分類網路預訓練10個epochs訓練448×448的影像,並接續訓練160個epochs。
Detection: 移除上面預訓練好的classification模型最後一層convolution層,並添加三層3×3×1024的卷積層,以及最後加入一層輸出層(1×1×(5 boxes × (5 coordinates +類別數))),中間有加入passthorough層。
實驗結果
文章使用之圖片擷取自該篇論文
留言
追蹤
檢舉
上一篇
[DAY 2] YOLO的開端-YOLOv1
下一篇
[DAY 4] YOLOv3
系列文
YOLO系列網路技術採用以及實作
共
30
篇
目錄
RSS系列文
訂閱系列文
10
人訂閱
26
[DAY 26] YOLOv8模型訓練
27
[DAY 27] 訓練資料前處理(補充)
28
[DAY 28] 訓練資料擴充(補充)
29
[DAY 29] 模型訓練結果
30
[DAY 30] 完賽心得
完整目錄
熱門推薦
{{ item.subject }}
{{ item.channelVendor }}
|
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
428
組
團體組數
14
組
累計文章數
3307
篇
最後報名日
9/15
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
17th鐵人賽
windows
php
c#
windows server
linux
css
react
熱門問題
不知道網路紅隊的要去那加公司
Jaspersoft 的資料庫連結 出現錯誤:驅動程式無法使用安全通訊端層 (SSL) 加密建立與 SQL Server 的安全連接。
Outlook 寄件備份消失問題 (已解決)
aws ec2 檢查故障問題
IIS 管理員 連線功能不見
請問有人遇過在lightsail上部屬fastapi失敗的案例?
尋求git之外的 高效能本機檔案備份 & 版本管理推薦
port-forwading到遠程網段
熱門回答
不知道網路紅隊的要去那加公司
尋求git之外的 高效能本機檔案備份 & 版本管理推薦
請問有人遇過在lightsail上部屬fastapi失敗的案例?
aws ec2 檢查故障問題
port-forwading到遠程網段
熱門文章
什麼是 Signal ?
序: AI 加速編碼後,你該學什麼?
Signal 的核心概念
第12天,即時通訊軟體選擇 / 金峰滷肉飯 台北名店(台北中正)| 30天滷肉飯
第13天,雲端硬碟軟體選擇 / 吉仔冬瓜肉飯 在地排隊美食(新北土城)| 30天滷肉飯
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}